logo logo

Uvod

Cilj ovog rada je analiza i predikcija dnevnih karata Temperature (Tempreture) na podrucju teritorije R. Srbije, na osnovu merenja dostupnih sa 65 mernih stanica. Merne stanice pripadaju OGIMET mrezi stanica. Prostorni domen predikcije definisan je pravilnim gridom cija prostorna dispozicija odgovara prostornom rasporedu mernih stanica, dok temporalni domen merenja obuhvata period od 10 godina (2009-2018). Merenja su dostupna na dnevnom nivou izrazena kao srednje, maksimalne i minimalne vrednosti dnevnog prikupljanja podataka sa senzora. U radu je koriscen programski jezik R sa dostupnim biblioteka putem kojih su implementirane tehnike Prostorno vremenske predikcije (gstat, spacetime).

Metodologija

Metodologija podrazumeva jasno definisan niz postupaka u cilju izrade karata srednje, maksimalne i minimalne vrednosti temperatura sa prostornom rezolucijom od 1km. Metodologija obuhvata koriscenje sledecih pristupa u oceni i predikciji posmatrane promenljive:

  • Koriscenje dodatnih kovarijata (covariates, explanatory variables) u cilju ocene trenda visestrukom linearnom regresijom (MLR - Multiple Linear Regression), kao sto su: GTT (Geometrial Temperatue Trend) - geometrijski temperaturni trend [Kilibarda et al., 2014], DEM (Digital Elevation Model) - Digitalni model visina i TWI (Topografic Wetness Index) - indeks vlaznosti terena.
  • Regression kriging - Regresioni kriging sa dostupnom ocenom globalnog trenda i variograma na osnovu modela dostupnog u radu [Kilibarda et al., 2014] i paketa ‘meteo’.
  • Regression kriging - Regresioni kriging sa ocenom lokalnog trenda visestrukom linearnom regresijom, kvanitifikacija i modelovanje prostorne korelacije na osnovu reziduala i predikcija vrednosti reziduala.

Kao ocena kvaliteta predikcije izvrsen je postupak krosvalidacije (CV - Cross-validation):

  • LOO - Leave-one station out - sukcesivno iskljucivanje pojedinacnih stanica iz modela i predikcija vrednosti u posmatranoj stanici na osnovu preostalih stanica.

Analiza i istrazivanje seta podataka

Analizom dostupnog seta podataka na raspolaganju su sledeci podaci:

  • 65 mernih stanica sa vrednostima koordinata tacaka u WGS84 referentnom koordinatnom sistemu
  • Vremenska serija podataka koja odgovara periodu od 01.01.2009 - 31.12.1018 godine (10 godina - 3652 dana). Kao jedinica mere definisana je [dan]
  • Vrednosti merenja posmatranih promenljivih - srednje (TMEAN), maksimalne (TMAX) i minimalne (TMIN) temperature u jedinicama mere [°C].

Prostorna dispozicija mernih stanica temperature

Za potrebe analize seta podataka i istrazivanja (sagledavanja lokacija mernih stanica, njihove udaljenosti i prostornog rasporeda, visina na kojima se nalaze), veoma je bitno u pocetnoj fazi rada sagledati prostornu dispoziciju seta podataka, kao i postaviti pocetne hipoteze u vezi njihovih lokacija. Na narednoj karti moguce je sagledati prostornu dispoziciju 65 mernih stanica.

Vremenska serija podataka

Analizom seta podataka, kreiran je graficki prikaz vremenske serije podataka. Na gornjem delu grafickog prikaza data je vremenska linija vrednosti Temperature, po godinama, sa tim sto su po \(\mathbf{x}\) osi date vrednosti vremenskih trenutaka izrazenih po Julianskom kalendaru (godina 2455000 po Julianskom kalendaru odgovara 2009 godini po Gregorijanskom kalendaru), Na donjem delu grafika dat je boxplot graficki prikaz Temperature izrazene po godinama, za srednje, maksimalne i minimalne vrednosti opazanja.

Histogram

Na sledecem grafickom prikazu dat je histogram frekvencija merenih vrednosti srednje, maksimalne i minimalne temperature, kao i kriva normalne rapodele koja odgovara datom uzorku. Uocava se da se podaci u potpunosti pokoravaju normalnoj raspodeli, sa srednjom vrednoscu i merama odstupanja vrednosti slucajne promenjive od njenog matematickog ocekivanja - standardnom devijacijom. Glavni preduslov za koriscenje tehnika predikcije - kriginga je da podaci, tj. uzorak merenja pripada normalnoj raspodeli, sto je i ispunjeno.

Hovmoller graficki prikaz

Hovmoller plot - graficki prikaz je dvodimenzionalni prostorno-vremenski nacin vizuelizacije. Prostorni domen je predstavljen na jednoj osi (projektovan ili osrednjen), dok je po drugoj osi definisano vreme. Ovakav nacin vizuelizacije se tradicionalno primenjuje u klimatologiji i meteorologiji, u naukama i oblastima koje se bave pracenjem stanja atmosfere, mora i okeana, kako bi se na veoma efikasan nacin predstavila - vizuelizovala propagacije entiteta. [Wikle et al., 2019] Pomocu ovakvog nacina vuzuelizacije moguce je sagledati korelacije u prostorno-vremenskom domenu, tj. npr. geografske sirine ili duzine i vremena, vremenskih trenutaka opazanja posmatrane promenljive. Na ovaj nacin moguce je ostvariti i preliminarni uvid u postajenje trenda koji se opisuje i koordinatama tacaka.

Hovmoller graficki prikaz - Latitude

Hovmoller graficki prikaz - Longitude

Grid - domen predikcije

Za potrebe predikcije vrednosti Temperature nad podrucjem od interesa i u vremenskom domenu, koji je definisan kao dan, kreiran je grid - skup tacaka na pravilnom i jednakom rastojanju. Prostorna rezolucija grid-a je 1km, dok je vremenska rezolucija 1 dan, posmatrano za vremesnki interval 01.01.2009-31.12.2018. Ciljni grid je kreiran kao objekat STF klase podataka, paketa “spacetime” (Spatio-Temporal Feature).

Prediktori (Covariates, Explanatory variables)

Digitalni model terena (DEM - Digital Elevation Model) i TWI (Topografic Wetness Index)

Predikcija i CV: TMEAN STRK_global i OGIMET

U okviru ovog poglavlja dat je opis, metodologija i rezultati predikcije Srednje vrednosti temperatura kao dnevnih karata na podrucju od interesa, obuhvacenog mernim stanicama. Metodologija se zasniva na koricenju predikcije primenom Regresionog Kriginga u prostorno-vremenskom domenu. Vrednost trenda je ocenjena na osnovu globalnog (STRK_global) modela [Kilibarda et al., 2014], gde su kao prediktori korisceni geometrijski temperaturni trend, DEM i TWI podaci na podrucju od interesa.

Karte predikcije

Krosvalidacija

Ocenu kvaliteta modela i predikcije kontinualne promenljive je moguce oceniti unutrasnjim i spoljasnjim merama kvaliteta. Kao unutrasnje mere kvaliteta, koriste se koeficijent determinacije lineranog modela i varijansa kriging predikcije. Kod spoljasnjih mera ocena kvaliteta modela predikcije, moZe se koristiti nezavisan set podataka kojim se model ocenjuje tokom ili nakon izgradnje modela. Kada nije dostupan set podataka za validaciju modela, moguce je iskoristiti isti set podataka, ali iskljucivanjem pojedinih prostornih i/ili vremesnkih entiteta - merenja iz izgradnje modela. Takva metoda ocene kvaliteta i validacije modela predikcije naziva se \(\mathbf{krosvalidacija}\).
Krosvalidacijom se vrsi ocena modela predikcije na taj nacin sto se za izgradnju modela koristi potpun set podataka, a zatim prilikom predikcije u zadatom prostorno-vremenskom domenu jedan i/ili vise merenja na jednoj ili viSe lokacija uzoraka se ne koriste. Koriste se sledece metode krosvalidacije:

  • \(\mathbf{LOOCV}\) - Leave-one-out cross validation - iskljucivanje jedne stanice ili entiteta u vremenskom domenu tokom predikcije.
  • \(\mathbf{5-FOLD}\) - Krosvalidacija sa iskljucivanjem 5 merenja u prostornom i/ili vremenskom domenu tokom predikcije ili deljenjem seta podataka na 5 grupa - foldova od kojih se jedan koristi za validaciju seta podataka, dok se preostali koriste za izgradnju modela.
  • \(\mathbf{5-FOLD-neasted-CV}\) - Ugnjezdena krosvalidacija sa 5 foldova, gde se podrazumeva kreiranje 5 grupa podataka, gde prilikom svake iteracije se jedna od grupa koristi za validaciju a preostale za izgradnju modela, i tako sukcesivno u sto vise nivoa i kreiranja podgrupa (sub-folds).

Date metode krosvalidacije nisu primenljive za modele koji ne podrazumevaju teoriju geostatistike, tj. teoriju prostorne korelacije. U ovom radu je koriscena prva metoda krosvalidacije - LOOCV u prostornom domenu sa pojedinacnim iskljucivanjem stanica iz predikcije. Sa obzirom da su dostupno 65 mernih stanica sa opazanjima od 10 godina - ukupno 3652 dana, dobijeno je ukupno 233728 (64x3652) karata predikcije. Na osnovu dobijenih podataka sracunate su mere kvaliteta krosvalidacije: koeficijent determinacije i ukupna srednje kvadratna greska predikcije.

Scatter plot i Histogram reziduala

Rezultati CV_STRK_global_tmean

Srednja kvadratna greska - \(\mathbf{RMSE}\) (Root Mean Square Error) predikcije, dobijena krosvalidacijom nad setom podataka, metodom LOOCV:

Srednje kvadratna greska - RMSE
RMSE units
1.4916 °C

Koeficijent determinacije \(\mathbf{R^2}\) predikcije, dobijen krosvalidacijom nad setom podataka, metodom LOOCV:

Koeficijent determinacije - R2
R2 units
0.9714 /

Analizom rezultata krosvalidacije u vremenskom domenu, nakon agregacije u prostornom domenu, moguce je ostvariti uvid u ocenu kvaliteta kao i opseg vrednosti po mesecima. Ocigledno je da postoji zakonitost u podacima, kojom se opisuje manji opseg vrednosti, kao i greska predikcije u letnjim mesecima. U zimskim mesecima postoji veca varijabilnost seta podataka, kao i da je greska predikcije veca.

Rezultati krosvalidacije u vremenskom domenu po mesecima:
MESEC RMSE [°C] MAX [°C] MIN [°C] MEAN [°C] RANGE [°C]
Jan 1.70 18.9 -17.2 1.40 36.1
Feb 1.59 23.0 -19.8 3.33 42.8
Mar 1.39 22.1 -13.4 7.73 35.5
Apr 1.28 27.6 0.0 13.19 27.6
Maj 1.31 27.9 2.2 17.17 25.7
Jun 1.39 33.4 9.2 21.05 24.2
Jul 1.46 35.4 11.7 23.39 23.7
Avg 1.49 35.0 10.6 23.37 24.4
Sep 1.43 31.5 5.9 18.61 25.6
Okt 1.42 26.8 0.1 12.49 26.7
Nov 1.57 22.9 -7.6 8.05 30.5
Dec 1.78 19.7 -15.0 2.75 34.7

Agregacijom seta podataka u prostornom domenu, moguce je ostvariti uvid u gresku predikcije metodom krosvalidacije po stanicama, na kojima je opazana temperatura - TMEAN za dati vremenski period.

Predikcija i CV: TMEAN STRK_local i OGIMET

U okviru ovog poglavlja dat je opis, metodologija i rezultati predikcije Srednje vrednosti temperatura kao dnevnih karata na podrucju od interesa, obuhvacenog mernim stanicama. Metodologija se zasniva na koricenju predikcije primenom Regresionog Kriginga u prostorno-vremenskom domenu. Vrednost trenda je ocenjena na osnovu lokalnog (STRK_local) modela, gde su kao prediktori korisceni geometrijski temperaturni trend, DEM i TWI podaci na podrucju od interesa. Koeficijenti trenda, kao i vrednosti reziduala su ocenjeni na osnovu MLR - multiple linear regression modela, a zatiom je kreiran i variogram na osnovu ocenjenih reziduala. Izvrsena je ocena i fitovanje empirijskog prostorno-vremenskog variograma (sum-metric variogram, putem R paketa ‘gstat’).

Variogram - modelovanje i kvantifikacija prostorne korelisanosti

Model koji je kreiran MLR regresijom, gde su kao prediktori korisceni GTT, DEM i TWI.

## 
## Call:
## lm(formula = tmean ~ gtt_mean + dem + twi, data = temp_df.lok)
## 
## Coefficients:
## (Intercept)     gtt_mean          dem          twi  
##   14.053091     1.015398    -0.007973    -0.482840

Empirijski prostorno-vremenski variogram

Nakon kreiranja prostorno-vremenskog variograma, koji opisuje set podataka i zavisnost - korelaciju izmedju merenja na razlicitim lokacijama i razlicitim vremenskim trenucima, potrebno je izvrsiti fitovanje modela - odredjivanje matematicke funcije i njenih parametara koji na najbolji moguci nacin opisuju set podataka. Fitovanje variograma se postize odredjivanjem inicijalnih parametara funkcije na osnovu vizuelnog pregleda podataka. Konacna empirijska funkcija, kao i njeni parametri se odredjuju automatski kroz vise iteracija. R programski paket “gstat” nudi vise modela za fitovanje variograma prostorno-vremenskih podataka: separable, product sum, metric, sum metric, and simple sum metric. Vise informacija o svakom modelu ponaosob se moze pronaci u radu [Graler et al., 2015]. Za modelovanje prostorno-vremenskog variograma vrednosti merenja srednje vrednosti temperatrura TMEAN, koriscen je sum metric model, koji podrazumeva ukljucivanje prostorne i vremenske komponente putem modela kovarijansi - poluvariograma, kao i zajednicke komponente sa vrednovanjam parametra anizotropije. Prostorno vremenska funkcija kovarijanse data je na sledeci nacin:
\[ \begin{aligned} \mathbf{Csm (h, u) = Cs (h) + Ct (u) + Cjoint (sqrt(h^2 + (k*u)^2))} \end{aligned} \]

gde je:

  • \(\mathbf{h}\) - rastojanje u prostornom domenu [m]
  • \(\mathbf{u}\) - rastojanje u vremenskom domenu [dan]
  • \(\mathbf{C}\) - matrica kovarijansi (s - prostorne, t - vremenske i joint - prostorno-vremenske komponente)
  • \(\mathbf{k}\) - parametar anizotropije

U cilju odredjivanja inicijalnih vrednosti parametara variograma potrebno je zadati pocetne vrednosti parametra psill - parcijalni prag i range - domet. Vrednost parcijalnog praga je priblizno jednaka vrednosti varijanse seta podataka. Za pocetnu vrednost dometa moguce je uzeti 1/4 vrednosti dijagonale minimalnog obuhvatnog pravougaonika podrucja od interesa obuhvacenog stanicama, sa tim da se ta vrednost uzima samo za prostornu komponentu.

Srednja vrednost varijanse vrednosti TMEAN na osnovu vrednosti po stanicama

Varijansa merenja u prostornom domenu
Variance_s units
14.1867 °C^2

Srednja vrednost varijanse vrednosti TMEAN na svim stanicama za posmatrani vremenski period [°C]

Varijansa merenja u vremenskom domenu
Variance_t units
14.9846 °C^2

Srednja vrednost varijanse vrednosti TMEAN u prostorno-vremenskom domenu [°C]

Varijansa merenja u prostorno-vremenskom domenu
Variance_j units
14.5857 °C^2

Prikaz empirijskog prostorno-vremenskog variograma, fitovanog koriscenjem sum-metric modela. Model je dobijen koriscenjem funkcija vgmST() i fit.StVariogram(), R programskog paketa “gstat”. Priblizna vrednost koeficijenta anizotropije je sracunata empirijski koriscenjem funkcije estiStAni(). Za fitovanje modela variograma koriscena je sferna funkcija kod sve tri komponente: prostorne, vremenske i zajednicke - prostorno-vremenske.

Mean Squared Error (MSE) - srednja kvadratna greska optimizacije modela variograma po metodi najmanjih kvadrata

Srednja kvadratna greska fitovanja variograma
Mean Squared Error units
0.2446 °C
Prostorna komponenta
model psill range
Nug 0.0000 0.0
Sph 1.9576 166975.5
Vremenska komponenta
model psill range
Nug 0.3604 0.0000
Sph 10.3668 9.8104
Prostorno-vremenska komponenta
model psill range
Nug 0.0000 0.0
Sph 1.9366 415421.3
Koeficijent anizotropije
anisotropy units
116.6199 km/day

Karte predikcije

Krosvalidacija

U ovom radu je koriscena metoda krosvalidacije - LOOCV u prostornom domenu sa pojedinacnim iskljucivanjem stanica iz predikcije. Koriscen je identican model - prostorno-vrmenski variogram dobijen na osnovu potpunog skupa merenja. Sa obzirom da su dostupno 65 mernih stanica sa opazanjima od 10 godina - ukupno 3652 dana, dobijeno je ukupno 233728 (64x3652) karata predikcije. Na osnovu dobijenih podataka sracunate su mere kvaliteta krosvalidacije: koeficijent determinacije i ukupna srednje kvadratna greska predikcije.

Scatter plot i Histogram reziduala

Rezultati CV_STRK_local_tmean

Srednja kvadratna greska - \(\mathbf{RMSE}\) (Root Mean Square Error) predikcije, dobijena krosvalidacijom nad setom podataka, metodom LOOCV:

Srednje kvadratna greska - RMSE
RMSE units
1.1053 °C

Koeficijent determinacije \(\mathbf{R^2}\) predikcije, dobijen krosvalidacijom nad setom podataka, metodom LOOCV:

Koeficijent determinacije - R2
R2 units
0.9843 /

Analizom rezultata krosvalidacije u vremenskom domenu, nakon agregacije u prostornom domenu, moguce je ostvariti uvid u ocenu kvaliteta kao i opseg vrednosti po mesecima.

Rezultati krosvalidacije u vremenskom domenu po mesecima:
MESEC RMSE [°C] MAX [°C] MIN [°C] MEAN [°C] RANGE [°C]
Jan 1.36 18.9 -17.2 1.40 36.1
Feb 1.24 23.0 -19.8 3.33 42.8
Mar 1.00 22.1 -13.4 7.73 35.5
Apr 0.94 27.6 0.0 13.19 27.6
Maj 0.87 27.9 2.2 17.17 25.7
Jun 0.88 33.4 9.2 21.05 24.2
Jul 0.96 35.4 11.7 23.39 23.7
Avg 1.03 35.0 10.6 23.37 24.4
Sep 1.01 31.5 5.9 18.61 25.6
Okt 1.07 26.8 0.1 12.49 26.7
Nov 1.31 22.9 -7.6 8.05 30.5
Dec 1.42 19.7 -15.0 2.75 34.7

Agregacijom seta podataka u prostornom domenu, moguce je ostvariti uvid u gresku predikcije po stanicama, na kojima je opazana temperatura - TMEAN za dati vremenski period.

Predikcija i CV: TMAX STRK_global i OGIMET

U okviru ovog poglavlja dat je opis, metodologija i rezultati predikcije Maksimalnih vrednosti temperatura kao dnevnih karata na podrucju od interesa, obuhvacenog mernim stanicama. Metodologija se zasniva na koricenju predikcije primenom Regresionog Kriginga u prostorno-vremenskom domenu. Vrednost trenda je ocenjena na osnovu globalnog (STRK_global) modela [Kilibarda et al., 2014], gde su kao prediktori korisceni geometrijski temperaturni trend, DEM i TWI podaci na podrucju od interesa.

Karte predikcije

Krosvalidacija

U ovom radu je koriscena metoda krosvalidacije - LOOCV u prostornom domenu sa pojedinacnim iskljucivanjem stanica iz predikcije. Sa obzirom da su dostupno 65 mernih stanica sa opazanjima od 10 godina - ukupno 3652 dana, dobijeno je ukupno 233728 (64x3652) karata predikcije. Na osnovu dobijenih podataka sracunate su mere kvaliteta krosvalidacije: koeficijent determinacije i ukupna srednje kvadratna greska predikcije.

Scatter plot i Histogram reziduala

Rezultati CV_STRK_global_tmax

Srednja kvadratna greska - \(\mathbf{RMSE}\) (Root Mean Square Error) predikcije, dobijena krosvalidacijom nad setom podataka, metodom LOOCV:

Srednje kvadratna greska - RMSE
RMSE units
1.7764 °C

Koeficijent determinacije \(\mathbf{R^2}\) predikcije, dobijen krosvalidacijom nad setom podataka, metodom LOOCV:

Koeficijent determinacije - R2
R2 units
0.9696 /

Analizom rezultata krosvalidacije u vremenskom domenu, nakon agregacije u prostornom domenu, moguce je ostvariti uvid u ocenu kvaliteta kao i opseg vrednosti po mesecima. Ocigledno je da postoji zakonitost u podacima, kojom se opisuje manji opseg vrednosti, kao i greska predikcije u letnjim mesecima. U zimskim mesecima postoji veca varijabilnost seta podataka, kao i da je greska predikcije veca.

Rezultati krosvalidacije u vremenskom domenu po mesecima:
MESEC RMSE [°C] MAX [°C] MIN [°C] MEAN [°C] RANGE [°C]
Jan 2.09 21.8 -11.9 5.35 33.7
Feb 1.95 29.4 -12.9 7.72 42.3
Mar 1.68 27.6 -7.8 13.22 35.4
Apr 1.58 34.0 1.4 19.45 32.6
Maj 1.55 36.4 4.5 23.34 31.9
Jun 1.59 42.3 11.6 27.28 30.7
Jul 1.62 42.8 13.8 30.13 29.0
Avg 1.64 43.9 14.6 30.66 29.3
Sep 1.60 40.2 9.9 25.43 30.3
Okt 1.65 35.0 1.2 18.58 33.8
Nov 1.91 30.0 -3.7 13.23 33.7
Dec 2.28 27.0 -9.3 6.75 36.3

Agregacijom seta podataka u prostornom domenu, moguce je ostvariti uvid u gresku predikcije metodom krosvalidacije po stanicama, na kojima je opazana temperatura - tmax za dati vremenski period.

Predikcija i CV: TMAX STRK_local i OGIMET

U okviru ovog poglavlja dat je opis, metodologija i rezultati predikcije Maksimalne vrednosti temperatura kao dnevnih karata na podrucju od interesa, obuhvacenog mernim stanicama. Metodologija se zasniva na koricenju predikcije primenom Regresionog Kriginga u prostorno-vremenskom domenu. Vrednost trenda je ocenjena na osnovu lokalnog (STRK_local) modela, gde su kao prediktori korisceni geometrijski temperaturni trend, DEM i TWI podaci na podrucju od interesa. Koeficijenti trenda, kao i vrednosti reziduala su ocenjeni na osnovu MLR - multiple linear regression modela, a zatiom je kreiran i variogram na osnovu ocenjenih reziduala. Izvrsena je ocena i fitovanje empirijskog prostorno-vremenskog variograma (sum-metric variogram, putem R paketa ‘gstat’).

Variogram - modelovanje i kvantifikacija prostorne korelisanosti

Model koji je kreiran MLR regresijom, gde su kao prediktori korisceni GTT, DEM i TWI.

## 
## Call:
## lm(formula = tmax ~ gtt_max + dem + twi, data = temp_df.lok)
## 
## Coefficients:
## (Intercept)      gtt_max          dem          twi  
##    7.091419     1.154409    -0.005855    -0.251901

Empirijski prostorno-vremenski variogram

Nakon kreiranja prostorno-vremenskog variograma, koji opisuje set podataka i zavisnost - korelaciju izmedju merenja na razlicitim lokacijama i razlicitim vremenskim trenucima, potrebno je izvrsiti fitovanje modela - odredjivanje matematicke funcije i njenih parametara koji na najbolji moguci nacin opisuju set podataka. Fitovanje variograma se postize odredjivanjem inicijalnih parametara funkcije na osnovu vizuelnog pregleda podataka. Konacna empirijska funkcija, kao i njeni parametri se odredjuju automatski kroz vise iteracija. R programski paket “gstat” nudi vise modela za fitovanje variograma prostorno-vremenskih podataka: separable, product sum, metric, sum metric, and simple sum metric. Vise informacija o svakom modelu ponaosob se moze pronaci u radu [Graler et al., 2015]. Za modelovanje prostorno-vremenskog variograma vrednosti merenja Maksimalne vrednosti temperatrura TMAX, koriscen je sum metric model, koji podrazumeva ukljucivanje prostorne i vremenske komponente putem modela kovarijansi - poluvariograma, kao i zajednicke komponente sa vrednovanjam parametra anizotropije. Prostorno vremenska funkcija kovarijanse data je na sledeci nacin:
\[ \begin{aligned} \mathbf{Csm (h, u) = Cs (h) + Ct (u) + Cjoint (sqrt(h^2 + (k*u)^2))} \end{aligned} \]

gde je:

  • \(\mathbf{h}\) - rastojanje u prostornom domenu [m]
  • \(\mathbf{u}\) - rastojanje u vremenskom domenu [dan]
  • \(\mathbf{C}\) - matrica kovarijansi (s - prostorne, t - vremenske i joint - prostorno-vremenske komponente)
  • \(\mathbf{k}\) - parametar anizotropije

U cilju odredjivanja inicijalnih vrednosti parametara variograma potrebno je zadati pocetne vrednosti parametra psill - parcijalni prag i range - domet. Vrednost parcijalnog praga je priblizno jednaka vrednosti varijanse seta podataka. Za pocetnu vrednost dometa moguce je uzeti 1/4 vrednosti dijagonale minimalnog obuhvatnog pravougaonika podrucja od interesa obuhvacenog stanicama, sa tim da se ta vrednost uzima samo za prostornu komponentu.

Srednja vrednost varijanse vrednosti TMAX na osnovu vrednosti po stanicama

Varijansa merenja u prostornom domenu
Variance_s units
23.8744 °C^2

Srednja vrednost varijanse vrednosti TMAX na svim stanicama za posmatrani vremenski period [°C]

Varijansa merenja u vremenskom domenu
Variance_t units
24.6037 °C^2

Srednja vrednost varijanse vrednosti TMAX u prostorno-vremenskom domenu [°C]

Varijansa merenja u prostorno-vremenskom domenu
Variance_j units
24.239 °C^2

Prikaz empirijskog prostorno-vremenskog variograma, fitovanog koriscenjem sum-metric modela. Model je dobijen koriscenjem funkcija vgmST() i fit.StVariogram(), R programskog paketa “gstat”. Priblizna vrednost koeficijenta anizotropije je sracunata empirijski koriscenjem funkcije estiStAni(). Za fitovanje modela variograma koriscena je sferna funkcija kod sve tri komponente: prostorne, vremenske i zajednicke - prostorno-vremenske.

Mean Squared Error (MSE) - srednja kvadratna greska optimizacije modela variograma po metodi najmanjih kvadrata

Srednja kvadratna greska fitovanja variograma
Mean Squared Error units
1.0811 °C
Prostorna komponenta
model psill range
Nug 0.0000 0.00
Exp 4.3356 88495.95
Vremenska komponenta
model psill range
Nug 0.0000 0.0000
Sph 8.7455 11.4198
Prostorno-vremenska komponenta
model psill range
Nug 0.0000 0
Exp 11.8805 1142842
Koeficijent anizotropije
anisotropy units
478.6232 km/day

Karte predikcije

Krosvalidacija

U ovom radu je koriscena metoda krosvalidacije - LOOCV u prostornom domenu sa pojedinacnim iskljucivanjem stanica iz predikcije. Koriscen je identican model - prostorno-vrmenski variogram dobijen na osnovu potpunog skupa merenja. Sa obzirom da su dostupno 65 mernih stanica sa opazanjima od 10 godina - ukupno 3652 dana, dobijeno je ukupno 233728 (64x3652) karata predikcije. Na osnovu dobijenih podataka sracunate su mere kvaliteta krosvalidacije: koeficijent determinacije i ukupna srednje kvadratna greska predikcije.

Scatter plot i Histogram reziduala

Rezultati CV_STRK_local_tmax

Srednja kvadratna greska - \(\mathbf{RMSE}\) (Root Mean Square Error) predikcije, dobijena krosvalidacijom nad setom podataka, metodom LOOCV:

Srednje kvadratna greska - RMSE
RMSE units
1.386 °C

Koeficijent determinacije \(\mathbf{R^2}\) predikcije, dobijen krosvalidacijom nad setom podataka, metodom LOOCV:

Koeficijent determinacije - R2
R2 units
0.9815 /

Analizom rezultata krosvalidacije u vremenskom domenu, nakon agregacije u prostornom domenu, moguce je ostvariti uvid u ocenu kvaliteta kao i opseg vrednosti po mesecima.

Rezultati krosvalidacije u vremenskom domenu po mesecima:
MESEC RMSE [°C] MAX [°C] MIN [°C] MEAN [°C] RANGE [°C]
Jan 1.71 21.8 -11.9 5.35 33.7
Feb 1.57 29.4 -12.9 7.72 42.3
Mar 1.25 27.6 -7.8 13.22 35.4
Apr 1.23 34.0 1.4 19.45 32.6
Maj 1.14 36.4 4.5 23.34 31.9
Jun 1.13 42.3 11.6 27.28 30.7
Jul 1.18 42.8 13.8 30.13 29.0
Avg 1.28 43.9 14.6 30.66 29.3
Sep 1.22 40.2 9.9 25.43 30.3
Okt 1.29 35.0 1.2 18.58 33.8
Nov 1.55 30.0 -3.7 13.23 33.7
Dec 1.88 27.0 -9.3 6.75 36.3

Agregacijom seta podataka u prostornom domenu, moguce je ostvariti uvid u gresku predikcije po stanicama, na kojima je opazana temperatura - TMAX za dati vremenski period.

Predikcija i CV: TMIN STRK_global i OGIMET

U okviru ovog poglavlja dat je opis, metodologija i rezultati predikcije Minimalnih vrednosti temperatura kao dnevnih karata na podrucju od interesa, obuhvacenog mernim stanicama. Metodologija se zasniva na koricenju predikcije primenom Regresionog Kriginga u prostorno-vremenskom domenu. Vrednost trenda je ocenjena na osnovu globalnog (STRK_global) modela [Kilibarda et al., 2014], gde su kao prediktori korisceni geometrijski temperaturni trend, DEM i TWI podaci na podrucju od interesa.

Karte predikcije

Krosvalidacija

U ovom radu je koriscena metoda krosvalidacije - LOOCV u prostornom domenu sa pojedinacnim iskljucivanjem stanica iz predikcije. Sa obzirom da su dostupno 65 mernih stanica sa opazanjima od 10 godina - ukupno 3652 dana, dobijeno je ukupno 233728 (64x3652) karata predikcije. Na osnovu dobijenih podataka sracunate su mere kvaliteta krosvalidacije: koeficijent determinacije i ukupna srednje kvadratna greska predikcije.

Scatter plot i Histogram reziduala

Rezultati CV_STRK_global_tmin

Srednja kvadratna greska - \(\mathbf{RMSE}\) (Root Mean Square Error) predikcije, dobijena krosvalidacijom nad setom podataka, metodom LOOCV:

Srednje kvadratna greska - RMSE
RMSE units
2.081 °C

Koeficijent determinacije \(\mathbf{R^2}\) predikcije, dobijen krosvalidacijom nad setom podataka, metodom LOOCV:

Koeficijent determinacije - R2
R2 units
0.9309 /

Analizom rezultata krosvalidacije u vremenskom domenu, nakon agregacije u prostornom domenu, moguce je ostvariti uvid u ocenu kvaliteta kao i opseg vrednosti po mesecima. Ocigledno je da postoji zakonitost u podacima, kojom se opisuje manji opseg vrednosti, kao i greska predikcije u letnjim mesecima. U zimskim mesecima postoji veca varijabilnost seta podataka, kao i da je greska predikcije veca.

Rezultati krosvalidacije u vremenskom domenu po mesecima:
MESEC RMSE [°C] MAX [°C] MIN [°C] MEAN [°C] RANGE [°C]
Jan 2.17 15.4 -24.8 -2.27 40.2
Feb 2.11 17.6 -28.7 -0.59 46.3
Mar 2.02 16.7 -24.5 2.58 41.2
Apr 2.02 21.0 -10.7 6.93 31.7
Maj 1.92 24.4 -6.6 11.12 31.0
Jun 1.96 29.8 -1.6 14.84 31.4
Jul 2.12 32.2 0.0 16.65 32.2
Avg 2.19 30.8 0.0 16.42 30.8
Sep 2.09 25.8 -2.4 12.57 28.2
Okt 2.05 22.8 -12.2 7.34 35.0
Nov 2.11 20.8 -22.2 3.77 43.0
Dec 2.20 17.7 -24.2 -0.84 41.9

Agregacijom seta podataka u prostornom domenu, moguce je ostvariti uvid u gresku predikcije metodom krosvalidacije po stanicama, na kojima je opazana temperatura - tmin za dati vremenski period.

Predikcija i CV: TMIN STRK_local i OGIMET

U okviru ovog poglavlja dat je opis, metodologija i rezultati predikcije Minimalne vrednosti temperatura kao dnevnih karata na podrucju od interesa, obuhvacenog mernim stanicama. Metodologija se zasniva na koricenju predikcije primenom Regresionog Kriginga u prostorno-vremenskom domenu. Vrednost trenda je ocenjena na osnovu lokalnog (STRK_local) modela, gde su kao prediktori korisceni geometrijski temperaturni trend, DEM i TWI podaci na podrucju od interesa. Koeficijenti trenda, kao i vrednosti reziduala su ocenjeni na osnovu MLR - multiple linear regression modela, a zatiom je kreiran i variogram na osnovu ocenjenih reziduala. Izvrsena je ocena i fitovanje empirijskog prostorno-vremenskog variograma (sum-metric variogram, putem R paketa ‘gstat’).

Variogram - modelovanje i kvantifikacija prostorne korelisanosti

Model koji je kreiran MLR regresijom, gde su kao prediktori korisceni GTT, DEM i TWI.

## 
## Call:
## lm(formula = tmin ~ gtt_min + dem + twi, data = temp_df.lok)
## 
## Coefficients:
## (Intercept)      gtt_min          dem          twi  
##   20.014113     0.861880    -0.009227    -0.723591

Empirijski prostorno-vremenski variogram

Nakon kreiranja prostorno-vremenskog variograma, koji opisuje set podataka i zavisnost - korelaciju izmedju merenja na razlicitim lokacijama i razlicitim vremenskim trenucima, potrebno je izvrsiti fitovanje modela - odredjivanje matematicke funcije i njenih parametara koji na najbolji moguci nacin opisuju set podataka. Fitovanje variograma se postize odredjivanjem inicijalnih parametara funkcije na osnovu vizuelnog pregleda podataka. Konacna empirijska funkcija, kao i njeni parametri se odredjuju automatski kroz vise iteracija. R programski paket “gstat” nudi vise modela za fitovanje variograma prostorno-vremenskih podataka: separable, product sum, metric, sum metric, and simple sum metric. Vise informacija o svakom modelu ponaosob se moze pronaci u radu [Graler et al., 2015]. Za modelovanje prostorno-vremenskog variograma vrednosti merenja Minimalne vrednosti temperatrura TMIN, koriscen je sum metric model, koji podrazumeva ukljucivanje prostorne i vremenske komponente putem modela kovarijansi - poluvariograma, kao i zajednicke komponente sa vrednovanjam parametra anizotropije. Prostorno vremenska funkcija kovarijanse data je na sledeci nacin:
\[ \begin{aligned} \mathbf{Csm (h, u) = Cs (h) + Ct (u) + Cjoint (sqrt(h^2 + (k*u)^2))} \end{aligned} \]

gde je:

  • \(\mathbf{h}\) - rastojanje u prostornom domenu [m]
  • \(\mathbf{u}\) - rastojanje u vremenskom domenu [dan]
  • \(\mathbf{C}\) - matrica kovarijansi (s - prostorne, t - vremenske i joint - prostorno-vremenske komponente)
  • \(\mathbf{k}\) - parametar anizotropije

U cilju odredjivanja inicijalnih vrednosti parametara variograma potrebno je zadati pocetne vrednosti parametra psill - parcijalni prag i range - domet. Vrednost parcijalnog praga je priblizno jednaka vrednosti varijanse seta podataka. Za pocetnu vrednost dometa moguce je uzeti 1/4 vrednosti dijagonale minimalnog obuhvatnog pravougaonika podrucja od interesa obuhvacenog stanicama, sa tim da se ta vrednost uzima samo za prostornu komponentu.

Srednja vrednost varijanse vrednosti TMIN na osnovu vrednosti po stanicama

Varijansa merenja u prostornom domenu
Variance_s units
13.6081 °C^2

Srednja vrednost varijanse vrednosti TMIN na svim stanicama za posmatrani vremenski period [°C]

Varijansa merenja u vremenskom domenu
Variance_t units
15.272 °C^2

Srednja vrednost varijanse vrednosti TMIN u prostorno-vremenskom domenu [°C]

Varijansa merenja u prostorno-vremenskom domenu
Variance_j units
14.44 °C^2

Prikaz empirijskog prostorno-vremenskog variograma, fitovanog koriscenjem sum-metric modela. Model je dobijen koriscenjem funkcija vgmST() i fit.StVariogram(), R programskog paketa “gstat”. Priblizna vrednost koeficijenta anizotropije je sracunata empirijski koriscenjem funkcije estiStAni(). Za fitovanje modela variograma koriscena je sferna funkcija kod sve tri komponente: prostorne, vremenske i zajednicke - prostorno-vremenske.

Mean Squared Error (MSE) - srednja kvadratna greska optimizacije modela variograma po metodi najmanjih kvadrata

Srednja kvadratna greska fitovanja variograma
Mean Squared Error units
0.3267 °C
Prostorna komponenta
model psill range
Nug 0.2001 0.0
Exp 5.5829 439610.2
Vremenska komponenta
model psill range
Nug 0.0000 0.0000
Sph 3.3674 4.4342
Prostorno-vremenska komponenta
model psill range
Nug 0.8277 0.0
Exp 9.0707 745700.6
Koeficijent anizotropije
anisotropy units
195.1982 km/day

Karte predikcije

Krosvalidacija

U ovom radu je koriscena metoda krosvalidacije - LOOCV u prostornom domenu sa pojedinacnim iskljucivanjem stanica iz predikcije. Koriscen je identican model - prostorno-vrmenski variogram dobijen na osnovu potpunog skupa merenja. Sa obzirom da su dostupno 65 mernih stanica sa opazanjima od 10 godina - ukupno 3652 dana, dobijeno je ukupno 233728 (64x3652) karata predikcije. Na osnovu dobijenih podataka sracunate su mere kvaliteta krosvalidacije: koeficijent determinacije i ukupna srednje kvadratna greska predikcije.

Scatter plot i Histogram reziduala

Rezultati CV_STRK_local_tmin

Srednja kvadratna greska - \(\mathbf{RMSE}\) (Root Mean Square Error) predikcije, dobijena krosvalidacijom nad setom podataka, metodom LOOCV:

Srednje kvadratna greska - RMSE
RMSE units
1.7833 °C

Koeficijent determinacije \(\mathbf{R^2}\) predikcije, dobijen krosvalidacijom nad setom podataka, metodom LOOCV:

Koeficijent determinacije - R2
R2 units
0.9492 /

Analizom rezultata krosvalidacije u vremenskom domenu, nakon agregacije u prostornom domenu, moguce je ostvariti uvid u ocenu kvaliteta kao i opseg vrednosti po mesecima.

Rezultati krosvalidacije u vremenskom domenu po mesecima:
MESEC RMSE [°C] MAX [°C] MIN [°C] MEAN [°C] RANGE [°C]
Jan 1.87 15.4 -24.8 -2.27 40.2
Feb 1.82 17.6 -28.7 -0.59 46.3
Mar 1.78 16.7 -24.5 2.58 41.2
Apr 1.82 21.0 -10.7 6.93 31.7
Maj 1.64 24.4 -6.6 11.12 31.0
Jun 1.62 29.8 -1.6 14.84 31.4
Jul 1.75 32.2 0.0 16.65 32.2
Avg 1.82 30.8 0.0 16.42 30.8
Sep 1.74 25.8 -2.4 12.57 28.2
Okt 1.77 22.8 -12.2 7.34 35.0
Nov 1.87 20.8 -22.2 3.77 43.0
Dec 1.88 17.7 -24.2 -0.84 41.9

Agregacijom seta podataka u prostornom domenu, moguce je ostvariti uvid u gresku predikcije po stanicama, na kojima je opazana temperatura - TMIN za dati vremenski period.